Os dados são do banco Prosper, falam a respeito de investimentos. São 113937 empréstimos com 81 variáveis sobre eles.
## 'data.frame': 113937 obs. of 81 variables:
## $ ListingKey : Factor w/ 113066 levels "00003546482094282EF90E5",..: 7180 7193 6647 6669 6686 6689 6699 6706 6687 6687 ...
## $ ListingNumber : int 193129 1209647 81716 658116 909464 1074836 750899 768193 1023355 1023355 ...
## $ ListingCreationDate : Factor w/ 113064 levels "2005-11-09 20:44:28.847000000",..: 14184 111894 6429 64760 85967 100310 72556 74019 97834 97834 ...
## $ CreditGrade : Factor w/ 9 levels "","A","AA","B",..: 5 1 8 1 1 1 1 1 1 1 ...
## $ Term : int 36 36 36 36 36 60 36 36 36 36 ...
## $ LoanStatus : Factor w/ 12 levels "Cancelled","Chargedoff",..: 3 4 3 4 4 4 4 4 4 4 ...
## $ ClosedDate : Factor w/ 2803 levels "","2005-11-25 00:00:00",..: 1138 1 1263 1 1 1 1 1 1 1 ...
## $ BorrowerAPR : num 0.165 0.12 0.283 0.125 0.246 ...
## $ BorrowerRate : num 0.158 0.092 0.275 0.0974 0.2085 ...
## $ LenderYield : num 0.138 0.082 0.24 0.0874 0.1985 ...
## $ EstimatedEffectiveYield : num NA 0.0796 NA 0.0849 0.1832 ...
## $ EstimatedLoss : num NA 0.0249 NA 0.0249 0.0925 ...
## $ EstimatedReturn : num NA 0.0547 NA 0.06 0.0907 ...
## $ ProsperRating..numeric. : int NA 6 NA 6 3 5 2 4 7 7 ...
## $ ProsperRating..Alpha. : Factor w/ 8 levels "","A","AA","B",..: 1 2 1 2 6 4 7 5 3 3 ...
## $ ProsperScore : num NA 7 NA 9 4 10 2 4 9 11 ...
## $ ListingCategory..numeric. : int 0 2 0 16 2 1 1 2 7 7 ...
## $ BorrowerState : Factor w/ 52 levels "","AK","AL","AR",..: 7 7 12 12 25 34 18 6 16 16 ...
## $ Occupation : Factor w/ 68 levels "","Accountant/CPA",..: 37 43 37 52 21 43 50 29 24 24 ...
## $ EmploymentStatus : Factor w/ 9 levels "","Employed",..: 9 2 4 2 2 2 2 2 2 2 ...
## $ EmploymentStatusDuration : int 2 44 NA 113 44 82 172 103 269 269 ...
## $ IsBorrowerHomeowner : Factor w/ 2 levels "False","True": 2 1 1 2 2 2 1 1 2 2 ...
## $ CurrentlyInGroup : Factor w/ 2 levels "False","True": 2 1 2 1 1 1 1 1 1 1 ...
## $ GroupKey : Factor w/ 707 levels "","00343376901312423168731",..: 1 1 335 1 1 1 1 1 1 1 ...
## $ DateCreditPulled : Factor w/ 112992 levels "2005-11-09 00:30:04.487000000",..: 14347 111883 6446 64724 85857 100382 72500 73937 97888 97888 ...
## $ CreditScoreRangeLower : int 640 680 480 800 680 740 680 700 820 820 ...
## $ CreditScoreRangeUpper : int 659 699 499 819 699 759 699 719 839 839 ...
## $ FirstRecordedCreditLine : Factor w/ 11586 levels "","1947-08-24 00:00:00",..: 8639 6617 8927 2247 9498 497 8265 7685 5543 5543 ...
## $ CurrentCreditLines : int 5 14 NA 5 19 21 10 6 17 17 ...
## $ OpenCreditLines : int 4 14 NA 5 19 17 7 6 16 16 ...
## $ TotalCreditLinespast7years : int 12 29 3 29 49 49 20 10 32 32 ...
## $ OpenRevolvingAccounts : int 1 13 0 7 6 13 6 5 12 12 ...
## $ OpenRevolvingMonthlyPayment : num 24 389 0 115 220 1410 214 101 219 219 ...
## $ InquiriesLast6Months : int 3 3 0 0 1 0 0 3 1 1 ...
## $ TotalInquiries : num 3 5 1 1 9 2 0 16 6 6 ...
## $ CurrentDelinquencies : int 2 0 1 4 0 0 0 0 0 0 ...
## $ AmountDelinquent : num 472 0 NA 10056 0 ...
## $ DelinquenciesLast7Years : int 4 0 0 14 0 0 0 0 0 0 ...
## $ PublicRecordsLast10Years : int 0 1 0 0 0 0 0 1 0 0 ...
## $ PublicRecordsLast12Months : int 0 0 NA 0 0 0 0 0 0 0 ...
## $ RevolvingCreditBalance : num 0 3989 NA 1444 6193 ...
## $ BankcardUtilization : num 0 0.21 NA 0.04 0.81 0.39 0.72 0.13 0.11 0.11 ...
## $ AvailableBankcardCredit : num 1500 10266 NA 30754 695 ...
## $ TotalTrades : num 11 29 NA 26 39 47 16 10 29 29 ...
## $ TradesNeverDelinquent..percentage. : num 0.81 1 NA 0.76 0.95 1 0.68 0.8 1 1 ...
## $ TradesOpenedLast6Months : num 0 2 NA 0 2 0 0 0 1 1 ...
## $ DebtToIncomeRatio : num 0.17 0.18 0.06 0.15 0.26 0.36 0.27 0.24 0.25 0.25 ...
## $ IncomeRange : Factor w/ 8 levels "$0","$1-24,999",..: 4 5 7 4 3 3 4 4 4 4 ...
## $ IncomeVerifiable : Factor w/ 2 levels "False","True": 2 2 2 2 2 2 2 2 2 2 ...
## $ StatedMonthlyIncome : num 3083 6125 2083 2875 9583 ...
## $ LoanKey : Factor w/ 113066 levels "00003683605746079487FF7",..: 100337 69837 46303 70776 71387 86505 91250 5425 908 908 ...
## $ TotalProsperLoans : int NA NA NA NA 1 NA NA NA NA NA ...
## $ TotalProsperPaymentsBilled : int NA NA NA NA 11 NA NA NA NA NA ...
## $ OnTimeProsperPayments : int NA NA NA NA 11 NA NA NA NA NA ...
## $ ProsperPaymentsLessThanOneMonthLate: int NA NA NA NA 0 NA NA NA NA NA ...
## $ ProsperPaymentsOneMonthPlusLate : int NA NA NA NA 0 NA NA NA NA NA ...
## $ ProsperPrincipalBorrowed : num NA NA NA NA 11000 NA NA NA NA NA ...
## $ ProsperPrincipalOutstanding : num NA NA NA NA 9948 ...
## $ ScorexChangeAtTimeOfListing : int NA NA NA NA NA NA NA NA NA NA ...
## $ LoanCurrentDaysDelinquent : int 0 0 0 0 0 0 0 0 0 0 ...
## $ LoanFirstDefaultedCycleNumber : int NA NA NA NA NA NA NA NA NA NA ...
## $ LoanMonthsSinceOrigination : int 78 0 86 16 6 3 11 10 3 3 ...
## $ LoanNumber : int 19141 134815 6466 77296 102670 123257 88353 90051 121268 121268 ...
## $ LoanOriginalAmount : int 9425 10000 3001 10000 15000 15000 3000 10000 10000 10000 ...
## $ LoanOriginationDate : Factor w/ 1873 levels "2005-11-15 00:00:00",..: 426 1866 260 1535 1757 1821 1649 1666 1813 1813 ...
## $ LoanOriginationQuarter : Factor w/ 33 levels "Q1 2006","Q1 2007",..: 18 8 2 32 24 33 16 16 33 33 ...
## $ MemberKey : Factor w/ 90831 levels "00003397697413387CAF966",..: 11071 10302 33781 54939 19465 48037 60448 40951 26129 26129 ...
## $ MonthlyLoanPayment : num 330 319 123 321 564 ...
## $ LP_CustomerPayments : num 11396 0 4187 5143 2820 ...
## $ LP_CustomerPrincipalPayments : num 9425 0 3001 4091 1563 ...
## $ LP_InterestandFees : num 1971 0 1186 1052 1257 ...
## $ LP_ServiceFees : num -133.2 0 -24.2 -108 -60.3 ...
## $ LP_CollectionFees : num 0 0 0 0 0 0 0 0 0 0 ...
## $ LP_GrossPrincipalLoss : num 0 0 0 0 0 0 0 0 0 0 ...
## $ LP_NetPrincipalLoss : num 0 0 0 0 0 0 0 0 0 0 ...
## $ LP_NonPrincipalRecoverypayments : num 0 0 0 0 0 0 0 0 0 0 ...
## $ PercentFunded : num 1 1 1 1 1 1 1 1 1 1 ...
## $ Recommendations : int 0 0 0 0 0 0 0 0 0 0 ...
## $ InvestmentFromFriendsCount : int 0 0 0 0 0 0 0 0 0 0 ...
## $ InvestmentFromFriendsAmount : num 0 0 0 0 0 0 0 0 0 0 ...
## $ Investors : int 258 1 41 158 20 1 1 1 1 1 ...
Como são muitas variáveis, irei selecionar somente algumas para serem usadas e sumarizadas. A escolha das variáveis será procurando relações entre caracteristícas do credor e de seu emprestímo.
## 'data.frame': 113937 obs. of 18 variables:
## $ ProsperRating..numeric. : int NA 6 NA 6 3 5 2 4 7 7 ...
## $ Occupation : Factor w/ 68 levels "","Accountant/CPA",..: 37 43 37 52 21 43 50 29 24 24 ...
## $ TotalProsperLoans : num 0 0 0 0 1 0 0 0 0 0 ...
## $ IncomeVerifiable : Factor w/ 2 levels "False","True": 2 2 2 2 2 2 2 2 2 2 ...
## $ IncomeRange : Factor w/ 8 levels "$0","$1-24,999",..: 4 5 7 4 3 3 4 4 4 4 ...
## $ BorrowerState : Factor w/ 52 levels "","AK","AL","AR",..: 7 7 12 12 25 34 18 6 16 16 ...
## $ BorrowerRate : num 0.158 0.092 0.275 0.0974 0.2085 ...
## $ MonthlyLoanPayment : num 330 319 123 321 564 ...
## $ EmploymentStatus : Factor w/ 9 levels "","Employed",..: 9 2 4 2 2 2 2 2 2 2 ...
## $ ListingCategory..numeric. : Factor w/ 21 levels "0","1","2","3",..: 1 3 1 17 3 2 2 3 8 8 ...
## $ LoanStatus : Factor w/ 12 levels "Cancelled","Chargedoff",..: 3 4 3 4 4 4 4 4 4 4 ...
## $ StatedMonthlyIncome : num 3083 6125 2083 2875 9583 ...
## $ BorrowerAPR : num 0.165 0.12 0.283 0.125 0.246 ...
## $ IsBorrowerHomeowner : Factor w/ 2 levels "False","True": 2 1 1 2 2 2 1 1 2 2 ...
## $ CreditScoreRangeLower : int 640 680 480 800 680 740 680 700 820 820 ...
## $ OpenRevolvingAccounts : int 1 13 0 7 6 13 6 5 12 12 ...
## $ DebtToIncomeRatio : num 0.17 0.18 0.06 0.15 0.26 0.36 0.27 0.24 0.25 0.25 ...
## $ TradesNeverDelinquent..percentage.: num 0.81 1 NA 0.76 0.95 1 0.68 0.8 1 1 ...
## ProsperRating..numeric. Occupation
## Min. :1.000 Other :28617
## 1st Qu.:3.000 Professional :13628
## Median :4.000 Computer Programmer : 4478
## Mean :4.072 Executive : 4311
## 3rd Qu.:5.000 Teacher : 3759
## Max. :7.000 Administrative Assistant: 3688
## NA's :29084 (Other) :55456
## TotalProsperLoans IncomeVerifiable IncomeRange BorrowerState
## Min. :0.0000 False: 8669 $25,000-49,999:32192 CA :14717
## 1st Qu.:0.0000 True :105268 $50,000-74,999:31050 TX : 6842
## Median :0.0000 $100,000+ :17337 NY : 6729
## Mean :0.2755 $75,000-99,999:16916 FL : 6720
## 3rd Qu.:0.0000 Not displayed : 7741 IL : 5921
## Max. :8.0000 $1-24,999 : 7274 : 5515
## (Other) : 1427 (Other):67493
## BorrowerRate MonthlyLoanPayment EmploymentStatus
## Min. :0.0000 Min. : 0.0 Employed :67322
## 1st Qu.:0.1340 1st Qu.: 131.6 Full-time :26355
## Median :0.1840 Median : 217.7 Self-employed: 6134
## Mean :0.1928 Mean : 272.5 Not available: 5347
## 3rd Qu.:0.2500 3rd Qu.: 371.6 Other : 3806
## Max. :0.4975 Max. :2251.5 : 2255
## (Other) : 2718
## ListingCategory..numeric. LoanStatus
## 1 :58308 Current :56576
## 0 :16965 Completed :38074
## 7 :10494 Chargedoff :11992
## 2 : 7433 Defaulted : 5018
## 3 : 7189 Past Due (1-15 days) : 806
## 6 : 2572 Past Due (31-60 days): 363
## (Other):10976 (Other) : 1108
## StatedMonthlyIncome BorrowerAPR IsBorrowerHomeowner
## Min. : 0 Min. :0.00653 False:56459
## 1st Qu.: 3200 1st Qu.:0.15629 True :57478
## Median : 4667 Median :0.20976
## Mean : 5608 Mean :0.21883
## 3rd Qu.: 6825 3rd Qu.:0.28381
## Max. :1750003 Max. :0.51229
## NA's :25
## CreditScoreRangeLower OpenRevolvingAccounts DebtToIncomeRatio
## Min. : 0.0 Min. : 0.00 Min. : 0.000
## 1st Qu.:660.0 1st Qu.: 4.00 1st Qu.: 0.140
## Median :680.0 Median : 6.00 Median : 0.220
## Mean :685.6 Mean : 6.97 Mean : 0.276
## 3rd Qu.:720.0 3rd Qu.: 9.00 3rd Qu.: 0.320
## Max. :880.0 Max. :51.00 Max. :10.010
## NA's :591 NA's :8554
## TradesNeverDelinquent..percentage.
## Min. :0.000
## 1st Qu.:0.820
## Median :0.940
## Mean :0.886
## 3rd Qu.:1.000
## Max. :1.000
## NA's :7544
O ListingCategory já nos diz que das razões mais comuns de empréstimo (exeptuando consolidação de dívida e outros) melhorias na casa é a maior seguido de negócios. Temos várias outras informações nesses resumos. Mas analisarei os dados utilizando de gráficos.
## [1] "Taxa APR"
## Min. 1st Qu. Median Mean 3rd Qu. Max. NA's
## 0.00653 0.15629 0.20976 0.21883 0.28381 0.51229 25
Em Ambos os casos temos uma distribuição normal. Mesmo modificando-se os bins temos um salto em 0.35. Pode ser pela existência de alguma cota padrão.
## [1] "Verificado"
## Min. 1st Qu. Median Mean 3rd Qu. Max.
## 0 3333 4750 5656 6853 483333
## [1] "Normal"
## Min. 1st Qu. Median Mean 3rd Qu. Max.
## 0 3200 4667 5608 6825 1750003
Foi criado um data frame aonde se tem somente empréstimos em que a renda da pessoa que recorreu ao empréstimo foi verificada. Como esperado os valores de renda têm menos ruído quando verificados. Temos o Terceiro quartil valendo 6825. e o Primeiro valendo 3333. Logo uma grande gama numa pequena região. Os gráficos apresentam uma grande cauda.
## [1] "Por ano"
## Not displayed Not Employed 0 $1-24,99 $25,00-49,99
## 7741 806 621 7274 32192
## $50,00-74,99 $75,00-99,99 $100,00+
## 31050 16916 17337
Os grandes picos foram de 25 a 75 mil dolares por ano. o que dá 2.08 a 6.25 mil por mês o que bate com nosso achado do gráfico anterior.
## Min. 1st Qu. Median Mean 3rd Qu. Max. NA's
## 0.000 0.140 0.220 0.276 0.320 10.010 8554
Somente um pico. Interessante os valores serem em grande parte menores que 1 (foram retirados os 1% maiores)
## [1] "Normal"
## Employed Full-time Not available Not employed
## 2255 67322 26355 5347 835
## Other Part-time Retired Self-employed
## 3806 1088 795 6134
## [1] "Já pago"
## Employed Full-time Not available Not employed
## 1439 12332 17397 3077 344
## Other Part-time Retired Self-employed
## 449 794 459 1783
Como esperado, pessoas com trabalho de tempo integral se sairam melhor em pagar as dívidas.
## Min. 1st Qu. Median Mean 3rd Qu. Max. NA's
## 0.0 660.0 680.0 685.6 720.0 880.0 591
Outro gráfico que lembra uma normal. Porém tem uma grande queda a esquerda do pico. Nota-se também que os scores variam de 20 em 20.
## Min. 1st Qu. Median Mean 3rd Qu. Max. NA's
## 1.000 3.000 4.000 4.072 5.000 7.000 29084
Uma distribuição bem normal. Com um único pico no 4. Há uma defasagem maior que esperada na categoria 7.
## [1] "Normal"
## 0 1 2 3 4 5 6 7 8 9 10 11
## 16965 58308 7433 7189 2395 756 2572 10494 199 85 91 217
## 12 13 14 15 16 17 18 19 20
## 59 1996 876 1522 304 52 885 768 771
## [1] "Já pago"
## 0 1 2 3 4 5 6 7 8 9 10 11
## 10253 13167 2434 2848 1620 561 1210 4551 27 25 34 57
## 12 13 14 15 16 17 18 19 20
## 10 371 135 239 86 16 160 145 125
Temos que: 0 - Mão disponível, 1 - Consolidação de débito, 2 - Reforma da casa, 3 - Negócios,4 - Empréstimo pessoal, 5 - Uso estudantil, 6 - Carro, 7- Outro, 8 - Bebê e adoção, 9 - Barco, 10 - Cirúrgia cosmética, 11 - Anel de noivado, 12 - Empréstimos verdes, 13 - Despesas de casa, 14 - Grandes Compras, 15 - Medico/Dental, 16 - Motocicleta, 17 - trailer, 18 - Taxas, 19 - Férias, 20 - Empréstimos de casamento.
O gráfico inferior me diz qual a porcentagem de pessoas por categoria que efetivamente pagou e o superior é o sem restrição. Tivemos um resultado esperado. Quem consolida dívidas paga menos a dívida. Também é visivel pelos gráficos que a prosper é um banco que uma boa parte dos seus negócios é a consolidação de dívidas
São 113937 empréstimos e há 81 variáveis. Divididas em 3 categorias:
Outras observações:
São bastantes variáveis, estou colocando como principais a taxa de juros cobrada e o status do empréstimo(para analisar o que faz as pessoas pagarem).
Já separei as variáveis que tenho interesse em utilizar, são elas:
## [1] "ProsperRating..numeric."
## [2] "Occupation"
## [3] "TotalProsperLoans"
## [4] "IncomeVerifiable"
## [5] "IncomeRange"
## [6] "BorrowerState"
## [7] "BorrowerRate"
## [8] "MonthlyLoanPayment"
## [9] "EmploymentStatus"
## [10] "ListingCategory..numeric."
## [11] "LoanStatus"
## [12] "StatedMonthlyIncome"
## [13] "BorrowerAPR"
## [14] "IsBorrowerHomeowner"
## [15] "CreditScoreRangeLower"
## [16] "OpenRevolvingAccounts"
## [17] "DebtToIncomeRatio"
## [18] "TradesNeverDelinquent..percentage."
Criei 2 novos datasets, um que só aceita entradas de empréstimos que já finalizaram sem grandes problemas e outro que só aceita entradas de empréstimos em que a renda do usuário foi verificada.
Sim. Teve distribuições com valores muito fora do escopo. Um exemplo é o débito pra renda que havia uma pessoa que devia 1000% de sua renda. Para limpar isso utilizei quando necessário a função quantile para retirar esses menos de 1% de dados sujos.
Houve uma boa correlação entre creditScoreRangeLower e o BorrowerAPR, Ao contrário do que eu esperava. Ter muitas contas do tipo Revolving significa que a pessoa tem uma bom credit score. Provavelmente a pessoa precisaria já desse bom score alto para conseguir essas linhas de empréstimo. Porém ter muitas começa a diminuir o score.
Também houve boa correlação entre pessoas com mau histórico e o Credit Score.
Irei analisar agora essa relação entre a taxa de juros(BorrowerAPR) e o credit score.
## [1] "R^2:"
## [1] 0.1846484
Curioso que mal há mudança na taxa de juros até o limiar de 650 de Credit Score. há um aumento aliás. Enquanto após 650 há uma queda contínua. Irei verificar agora a taxa de juros com outras variáveis.
Só há queda da taxa de juros inicialmente. A partir de quando os salarios ficam maiores deixa de haver está variação. Esperava uma influência maior.
## # A tibble: 2 x 3
## IsBorrowerHomeowner BorrowerAPR_median BorrowerAPR_mean
## <fctr> <dbl> <dbl>
## 1 False 0.22362 0.2296001
## 2 True 0.19645 0.2082509
Nota-se uma grande mudança nos valores da taxa de juros de a pessoa tem ou não casa. tivemos 0.02 de diferença na taxa de juros média.
Quase 0.1 de mudança de taxa de juros. Pessoas que arriscam empréstimos alto demais para a sua a condição pagam ainda mais de juros
Outro gráfico que se estabiliza e causa só uma diminuição leve no início. Ser um cliente com contas abertas ajuda a diminuir a taxa de juros.
Agora, depois de ter criado uma variável que diz se a pessoa não está com problemas no pagamento (usando a LoanStatus). Irei analisar os parametros anteriores contra essa novo variável. Vale reasaltar que para as dívidas em progresso sem percausos irei considerar como bom pagador.
## # A tibble: 2 x 3
## pago StatedMonthlyIncome_median StatedMonthlyIncome_mean
## <fctr> <dbl> <dbl>
## 1 Bom Pagador 5000.000 5851.083
## 2 Mau Pagador 3916.667 4681.716
A média varia quase 1000 dolares entre os maus pagadores e os bons. A variação ocorre justamente na área aonde há queda na taxa de juros. Provavelmente há um custo mínimo de vida perto dessa faixa que faz com que essa diferença seja mais pronunciada.
## # A tibble: 2 x 3
## pago CreditScoreRangeLower_median CreditScoreRangeLower_mean
## <fctr> <int> <dbl>
## 1 Bom Pagador 700 692.7701
## 2 Mau Pagador 660 642.3021
Até agora o Score tem exercido uma influência significativa e não deixa de demonstrar seu valor nesse boxplot com uma diferença pronunciada entre o mau e bom pagador. Especialmente entre 600 e 650 de score
## # A tibble: 2 x 3
## pago DebtToIncomeRatio_median DebtToIncomeRatio_mean
## <fctr> <dbl> <dbl>
## 1 Bom Pagador 0.22 0.2523336
## 2 Mau Pagador 0.22 0.2915149
As medianas foram bem iguais. Porém os bons pagadores foram mais concentrados.
## # A tibble: 2 x 3
## pago BorrowerAPR_median BorrowerAPR_mean
## <fctr> <dbl> <dbl>
## 1 Bom Pagador 0.20065 0.2094356
## 2 Mau Pagador 0.25249 0.2505746
Uma boa diferença na taxa de juros para pessoas que estão pagando em dia e os maus pagadores. Porém há uma dúvida entre quem é a causa e quem é o causador. Será que foi a taxa de juros que não permitiu a pessoa pagar direito. Ou foi a pessoa não ter um bom prospecto que aumentou a taxa?
Irei analisar o Score
Aparentemente o score não liga muito para essa variável.
Muito estranho esse comportamento. Ele primeiro diminui um pouco o score quando a pessoa tem mais renda. Sendo o score mínimo perto de 1700 dolares por mês de renda.
## # A tibble: 42 x 4
## pago ListingCategory..numeric. n pct
## <fctr> <fctr> <int> <dbl>
## 1 Bom Pagador 17 50 96.15
## 2 Bom Pagador 16 287 94.41
## 3 Bom Pagador 9 80 94.12
## 4 Bom Pagador 11 202 93.09
## 5 Bom Pagador 20 700 90.79
## 6 Bom Pagador 8 180 90.45
## 7 Bom Pagador 18 799 90.28
## 8 Bom Pagador 14 787 89.84
## 9 Bom Pagador 1 52362 89.80
## 10 Bom Pagador 19 688 89.58
## # ... with 32 more rows
O top 3 melhores pagadores foram pessoas que pegaram o empréstimo para comprar trailer. Seguido de motocicleta e barco. Todos veículos. Em quarto vem o anel de noivado. Seguido pelos empréstimos de casamento.
Já para os mau pagadores. O campo não definido “Não disponivel” é o pior. Mas retirando ele temos como top 3: Empréstimo pessoal, Uso Estudantil, Negócios. E emprestimos verdes e despesas da casa logo atrás. Note que são bens que não tem como haver devolução.
Uma incrivel influência no ato de nunca ter tido problemas com empréstimos e o seu grade.
A taxa diminui bastante se a pessoa nunca falhou num empréstimo.
Basicamente todos variaram conforme o esperado. Tirando exceções. O Score demonstrou ter uma influência muito maior do que previ na taxa de juros enquanto a relação débito renda não influenciou tanto assim. Maior parte dos casos a alteração foi de meio porcento a 1 porcento.
Já nos gráficos que avaliava se a pessoa foi uma boa pagadora mostrou que ter um score abaixo de 650 é um grande indicativo disso(assim como acima de 650 é quando o juros começam a diminuir). Nas demais variáveis comportamentos esperados tirando o ratio débito-renda que não se pode afirmar muita coisa. só que ao sair de uma certa faixa aumenta-se a chance de a pessoa se tornar má pagadora.
Notou-se também que carros e automóveis parecem empréstimos bons para se fazer. Pois costumam ser devolvido o dinheiro. Porém ainda é necessário fazer uma análise estatística maior para veríficar se não é só desvio estatístico.
Por fim o histórico da pessoa influencia muito na taxa de juros obtida.
O Credit Score foi bastante interessante. Diminuindo sem motivo aparente ao se aumentar a renda de um cidadão.
O TradesNeverDelinquent Percentage se mostrou incrivelmente influente no Credit Score e na taxa de juros.
Entre a taxa de juros e o Score sem dúvida. Outros foram entre o Score e se a pessoa foi uma boa pagadora, mostrando que o Score é uma boa medida para analises do banco, e entre TradesNeverDelinquent Percentage e o Credit Score ou a taxa de juros.
Resultado esperado. Para o mesmo CreditScore se o empréstimo for de menor valor há maior chance da pessoa pagar corretamente.
## # A tibble: 4 x 4
## # Groups: pago [?]
## pago IsBorrowerHomeowner CreditScoreRangeLower_median
## <fctr> <fctr> <dbl>
## 1 Bom Pagador False 680
## 2 Bom Pagador True 700
## 3 Mau Pagador False 640
## 4 Mau Pagador True 680
## # ... with 1 more variables: CreditScoreRangeLower_mean <dbl>
Esse gráfico demonstra a força de ser dono de casa própria. Casa própria gerou um aumento no Credit Score que fez com que os maus pagadores com casa própria tivessem um score maior que os bons pagadores sem casa. Lembrando que o score não sabe de antemão que a pessoa não irá pagar corretamente, porém ele serve para tentar descobrir isso.
maus pagadores se endividam mais do que o normal. O que pode ser um índicio ao se negociar um empréstimo. A curva gerada foi bem interessante.Apresentando um mínimo local bem no centro.(650 de score). Pessoas com casa própria conseguiram empréstimos maiores em relação a seu patrimônio quando tinham o mesmo creditScore
## # A tibble: 4 x 4
## # Groups: pago [?]
## pago IsBorrowerHomeowner BorrowerRate_median BorrowerRate_mean
## <fctr> <fctr> <dbl> <dbl>
## 1 Bom Pagador False 0.1864 0.1942289
## 2 Bom Pagador True 0.1626 0.1759975
## 3 Mau Pagador False 0.2492 0.2406368
## 4 Mau Pagador True 0.2199 0.2208188
O banco vem acertando na taxa de juros. Cobrando mais dos que acabam sendo mau pagadores. Apesar que a elevada taxa de juros pode dificultar ainda mais no pagamento da dívida.
para emprestimos moderados o Credit Score supervaloriza um tanto a casa própria. mas isso se corrige para valores baixos e altos.
## [1] "correlações com o credit score"
## # A tibble: 6 x 2
## rowname CreditScoreRangeLower
## <chr> <dbl>
## 1 TotalProsperLoans -0.007761457
## 2 DebtToIncomeRatio -0.013168519
## 3 OpenRevolvingAccounts 0.210659461
## 4 StatedMonthlyIncome 0.107900823
## 5 BorrowerAPR -0.429707322
## 6 BorrowerRate -0.461566677
Aparentemente das variaveis referentes a pessoa que pega o empréstimo. débitos abertos é a variavel com maior peso. Seguido pela renda mensal Irei fazer uma análise parecida com a que fiz para o DebtToIncomeRatio com elas.
Nota-se o mesmo comportamento em todos os casos. e novamente o Credit Score parece superestimar o valor da casa própria.
Especialmente para rendas altas. ele continua dando CreditScore similar para pessoas q foram maus pagadores e para pessoas que foram/estão sendo boas pagadoras mas não tem casa.
Formato esperado. Pessoas sem casa pegam uma taxa levemente maior.
Tivemos um formado esperado. Ao aumentar a renda mensal se diminui o ratio débito-renda. Ter casa impactou nesse ratio, provavelmente porque parte da renda da pessoa estaria comprometida com o aluguel quando ela não tem casa. Efetivamente diminuindo a renda mensal. Criarei a variavel empregado agora que terá o valor “Empregado” o valor “Desempregado” e o valor “Aposentado”.
Ser aposentado tem um imenso fator. Provavelmete por ser uma renda fixa sólida. em seguida ter casa própria e por último ser empregado. Ser desempregado e não ter casa própria dá um credit score muito baixo. Ficando abaixo dos maus pagadores das outras categorias.
Paga menos o aposentado sem casa própria a partir de uma certa quantia. Difícil entender o motivo para isso, uma possibilidade é que não entra hipotécas e só crédito consignado para o aposentado sem casa. O banco acertou em todos os casos. Cobrando mais de quem se tornou mal pagador.
Ser aposentado por si só apresenta uma grande força. Seguido por ter casa própria e por último ser empregado. Provavelmente pelas possibilidades de crédito que liberam.
Um exemplo de interação supreendente é o fato de que a taxa de juros ser menor para aposentados sem casa própria.
Também é interessante notar que para um Credit Score de 630 em média. Não há diferença entre a taxa de juros de um bom pagador e de um mal. o que pode ser considerado um erro do banco que precisa ser melhor estudado.
Temos que: 0 - Mão disponível, 1 - Consolidação de débito, 2 - Reforma da casa, 3 - Negócios,4 - Empréstimo pessoal, 5 - Uso estudantil, 6 - Carro, 7- Outro, 8 - Bebê e adoção, 9 - Barco, 10 - Cirúrgia cosmética, 11 - Anel de noivado, 12 - Empréstimos verdes, 13 - Despesas de casa, 14 - Grandes Compras, 15 - Medico/Dental, 16 - Motocicleta, 17 - trailer, 18 - Taxas, 19 - Férias, 20 - Empréstimos de casamento.
Esse gráfico é bem interessante. Mostra que o motivo por trás do empréstimo impacta muito no ato dele ser pago. Na sua análise foi constatado que bens materiais são objetivos de aluguel que há os melhores pagadores. Já emprestímos mais abstratos como Uso Estudantil, negócios e empréstimo pessoal fazem parte do top 3 dos piores.
Um gráfico para evidenciar a importância do Credit Score nas decisões do banco. Sem dúvida a váriavel mais impactante nas decisões do banco. Perto de 620 a linha de bom pagador e mal pagador por algum motivo se tocam. Ou seja. Para esse Credit Score o banco cobra o mesmo dos que serão bons e maus pagadores. O que implica que estão errando.
Esse é o mesmo gráfico do relatório porém retirei a diferenciação de bom e mau pagador para melhor visibilidade. Achei interessante o fato do aposentado sem casa própria pagar uma menor taxa para grandes rendas menais. Minha consideração é que ele pega empréstimos consignados que são melhores. Enquanto o outro aposentado também pega hipotécas.
A análise dos empréstimos se mostrou mais complexa do que eu pensava a princípio. Eram muitas variáveis e nenhuma delas mostrava um impacto fundamental nas variaveis de interesse(bom pagador e taxa de juros). Com exceção do Credit Score que já é um grade que o banco faz nas pessoas que pegam os empréstimos.
Foi analisado que no ato de ser um bom pagador a motivação por trás da compra é muito relevante. Especialmente se a motivação for coisas sólidas como carro ou barco. Já para o Credit Score foi analisado a posse de casa própria e a o emprego. Ambos fatores contribuiram fortissamemente. Mas em especial aposentados tiveram uma ótima grade. O que provavelmente vem do fato deles terem uma fonte de renda muito sólida.
O que seria o quarto gráfico mais interessante seria o que mostra a importância de ter um bom nome e nunca ter falhado ao pagar um empréstimo. O Credit Score é dominado por esse valor. Logo a lição é pagar os empréstimos em dia.
Em trabalhos futuros seria interessante tentar entender como o credit score funciona e utilizar a variavel bom pagador para tentar avaliar se ele está sendo útil realmente(algumas falhas foram encontradas no relatório) e assim melhora-lo.